智能论文笔记

Learning Lipschitz Functions by GD-trained Shallow Overparameterized ReLU Neural Networks

Ilja Kuzborskij , Csaba Szepesvári

分类：机器学习 | (统计)机器学习

2022-12-28

We explore the ability of overparameterized shallow ReLU neural networks to learn Lipschitz, non-differentiable, bounded functions with additive noise when trained by Gradient Descent (GD). To avoid the problem that in the presence of noise, neural networks trained to nearly zero training error are inconsistent in this class, we focus on the early-stopped GD which allows us to show consistency and optimal rates. In particular, we explore this problem from the viewpoint of the Neural Tangent Kernel (NTK) approximation of a GD-trained finite-width neural network. We show that whenever some early stopping rule is guaranteed to give an optimal rate (of excess risk) on the Hilbert space of the kernel induced by the ReLU activation function, the same rule can be used to achieve minimax optimal rate for learning on the class of considered Lipschitz functions by neural networks. We discuss several data-free and data-dependent practically appealing stopping rules that yield optimal rates.

translated by 谷歌翻译

Stability & Generalisation of Gradient Descent for Shallow Neural Networks without the Neural Tangent Kernel

Dominic Richards , Ilja Kuzborskij

分类： (统计)机器学习 | 机器学习

2021-07-27

我们重新审视GD的平均算法稳定性，用于训练过度的浅色神经网络，并证明没有NTK或PL假设的新的泛化和过度的风险范围。特别是，我们显示Oracle类型的界限，揭示了GD的泛化和过度风险由具有最短GD路径的插值网络从初始化（从某种意义上是具有最小相对规范的内插网络）来控制。虽然这是封闭式嵌入式嵌入式的，但我们的证据直接适用于GD培训的网络，而无需中间结石。与此同时，通过在这里开发的放松Oracle不等式，我们以简单的方式恢复基于NTK的风险范围，这表明我们的分析更加紧张。最后，与大多数基于NTK的分析不同，我们专注于带标签噪声的回归，并显示早期停止的GD是一致的。

translated by 谷歌翻译

Learning to SLAM on the Fly in Unknown Environments: A Continual Learning Approach for Drones in Visually Ambiguous Scenes

Ali Safa , Tim Verbelen , Ilja Ocket , André Bourdoux , Hichem Sahli , Francky Catthoor , Georges Gielen

分类：机器人

2022-08-27

学习在未知环境中安全导航是监视和救援操作中使用的自动无人机的重要任务。近年来，已经提出了许多基于学习的同时定位和映射（SLAM）系统，这些系统依靠深神经网络（DNN）（DNNS）提出了用于传统功能描述符表现不佳的应用。但是，这种基于学习的SLAM系统依靠DNN功能编码在典型的深度学习环境中训练有素的离线训练。这使得它们不太适合在训练中未见的环境中部署的无人机，在训练中，持续适应至关重要。在本文中，我们提出了一种新的方法，可以通过调节低复杂性词典学习和稀疏编码（DLSC）管道，并使用新提出的二次贝叶斯惊喜（QBS）因素调节，以学习在未知环境中即时猛烈抨击。我们通过在充满挑战的仓库场景中通过无人机收集的数据来实验验证我们的方法，在这种情况下，大量模棱两可的场景使视觉上的歧义很难。

translated by 谷歌翻译

HTML版本

Nonwords Pronunciation Classification in Language Development Tests for Preschool Children

Ilja Baumann , Dominik Wagner , Sebastian Bayerl , Tobias Bocklet

分类：自然语言处理

2022-06-16

这项工作旨在自动评估儿童的语言发展是否适合年龄。经过验证的语音和语言测试用于此目的测试听觉记忆。在这项工作中，任务是确定是否正确说出了口语非单词。我们比较有动机来建模特定语言结构的不同方法：低水平特征（FFT），扬声器嵌入（ECAPA-TDNN），素化 - 动机的嵌入（WAV2VEC 2.0）和语音嵌入Senones（ASR ASR ACOSTIC模型）形式。每种方法都提供了类似VGG的5层CNN分类器的输入。我们还检查了每个非单词的适应性。使用来自口头非单词的不同幼儿园的录音进行了对拟议系统的评估。 ECAPA-TDNN和低级FFT特征不会明确模型语音信息； WAV2VEC2.0经过素数标签训练，我们的ASR声学模型包含（子）语音信息。我们发现，语音建模越颗粒状，达到的识别率就越高。在ASR声学模型特征上训练的最佳系统的精度为89.4％，在ROC（接收器操作特征）曲线（AUC）下的面积为0.923。与FFT-BASELINE相比，这对应于20.2％和AUC相对0.309的改善。

translated by 谷歌翻译

Learning Event-based Spatio-Temporal Feature Descriptors via Local Synaptic Plasticity: A Biologically-realistic Perspective of Computer Vision

Ali Safa , Hichem Sahli , André Bourdoux , Ilja Ocket , Francky Catthoor , Georges Gielen

分类：计算机视觉 | 神经与进化计算

2021-11-01

我们介绍了基于优化的理论，描述了在视觉皮质中的经验观察到的尖刺皮质组合，其配备有尖峰定时依赖性塑性（STDP）学习。使用我们的方法，我们为基于事件的相机构建了一类完全连接的，基于卷积和动作的特征描述符，即我们分别评估N-Mnist，挑战Cifar10-DVS以及IBM DVS128手势数据集。与传统的最先进的事件的特征描述符相比，我们报告了显着的准确性改进（CIFAR10-DVS上的+ 8％）。与最先进的STDP的系统（在N-MNIST上+ 10％+ 10％+ 10％，在IBM DVS128手势上举报的准确性提高了大量改进）。除了神经形态边缘装置的超低功率学习之外，我们的作品还有助于铺平朝向基于生物学 - 基于的皮质视觉理论的方式。

translated by 谷歌翻译